☰
17.3.4 멀티모달 입력 처리: 이미지, 자연어 명령, 그리고 로봇 상태(Proprioception)의 융합
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 17. 시각-언어-행동 모델 (Vision-Language-Action Models, VLA)
/
17.3 대표적인 VLA 모델 사례 분석
/
17.3.4 멀티모달 입력 처리: 이미지, 자연어 명령, 그리고 로봇 상태(Proprioception)의 융합
17.3.4 멀티모달 입력 처리: 이미지, 자연어 명령, 그리고 로봇 상태(Proprioception)의 융합